تولید درخت بانک سازه‌ای زبان فارسی به روش تبدیل خودکار

Authors

Abstract:

Treebanks is one of important and useful resource in Natural Language Processing tasks. Dependency and phrase structures are two famous kinds of treebanks. There have already made many efforts to convert dependency structure to phrase structure. In this paper we study an approach to convert dependency structure to phrase structure because of lack of a big phrase structure Treebank in Persian. Also we study the algorithm’s errors and propose a solution to solve the problem and improve the quality of conversion process. The experiment results show that we can improve the quality of conversion, about 25.85 percent, in Persian and about 4.39 percent in English. With the help of the conversion algorithm and the dependency Treebank, we produce the phrase structure treebank and train a parser using the resulted treebank. Our parser output is about 21 percent, better than the same parser introduced as baseline.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

تولید درخت بانک سازه ای زبان فارسی به روش تبدیل خودکار

درخت بانک از مهم­ترین و پرکاربردترین منابع مورد استفاده در زمینه پردازش زبان طبیعی است. دو نوع از پرکاربردترین درخت بانک­ ها، درخت بانک وابستگی و درخت بانک سازه­ ای است. با توجه به نبود درخت بانک سازه ­ای با حجم بزرگ در زبان فارسی در این مقاله به بررسی روشی ارائه شده در تبدیل درخت بانک وابستگی به سازه ­ای می­ پردازیم. سپس مشکلات این روش را در زبان فارسی و انگلیسی بررسی و با ارائه راهکارهایی کیف...

full text

ارائۀ راهکاری قاعده‌مند جهت تبدیل خودکار درخت تجزیۀ نحوی وابستگی به درخت تجزیۀ نحوی ساخت‌سازه‌ای برای زبان فارسی

In this paper, an automatic method in converting a dependency parse tree into an equivalent phrase structure one, is introduced for the Persian language. In first step, a rule-based algorithm was designed. Then, Persian specific dependency-to-phrase structure conversion rules merged to the algorithm. Subsequently, the Persian dependency treebank with about 30,000 sentences was used as an input ...

full text

تبدیل خودکار درخت‌بانک وابستگی فارسی به درخت‌بانک سازه‌ای

There are two major types of treebanks: dependency-based and constituency-based. Both of them have applications in natural language processing and computational linguistics. Several dependency treebanks have been developed for Persian. However, there is no available big size constituency treebank for this language. In this paper, we aim to propose an algorithm for automatic conversion of a depe...

full text

ارائۀ راهکاری قاعده مند جهت تبدیل خودکار درخت تجزیۀ نحوی وابستگی به درخت تجزیۀ نحوی ساخت سازه ای برای زبان فارسی

هدف مقاله حاضر ارائۀ روشی خودکار جهت تبدیل درخت تجزیه نحوی وابستگی به درخت تجزیه نحوی مبتنی بر دستور ساخت سازه ای معادل در زبان فارسی است. برای نیل بدین هدف، الگوریتمی قاعده مند جهت این نوع تبدیل طراحی شده است. به منظور دستیابی به درخت تجزیۀ نحوی ساخت سازه ای مناسب برای جملات زبان فارسی، دستور زبان فارسی مورد مطالعه قرار گرفته و قوانین خاص زبان فارسی استخراج و به الگوریتم مذکور افزوده شده است. ...

full text

بررسی فرایند تبدیل در زبان فارسی

چکیده پژوهش حاضر به مطالعه فرایند تبدیل در زبان فارسی در چارچوب کی‌فر(2005) می‌پردازد. هدف از این پژوهش توصیف انواع فرایند تبدیل در زبان فارسی است. بدین منظور ابتدا فهرستی از واژه‌هایی که به بیش از یک مقوله تحوی تعلق دارند از فرهنگ لغت صدری‌افشار و همکاران (1381) استخراج شده و بر اساس نوع مقوله نحوی‌شان گروه‌‌بندی می‌شوند. پس از قرار دادن واژه‌ها در 6 گروه، هر گروه به صورت جداگانه مورد بررسی ق...

full text

بررسی چگونگی افزایش ظرفیت زبان فارسی برای تبدیل شدن به زبان علمی جهانی

با توجه به روند تعاملات عصر حاضر مبنی‌بر شکل‌گیری دهکده‌ای جهانی، ملتی که با ابزار زبان و فرهنگ بومی، تعریفی از خود در این جهان ارائه ندهد، محکوم به از کف نهادن عناصر هویت‌ساز خویش و رنگ باختن در سیطره غالب فرهنگ‌ها و تمدن‌های بیگانه و ناآشنا است. در همین راستا رهبر معظم انقلاب چشم‌اندازی مبنی‌بر تبدیل زبان فارسی به یکی از زبان‌های علمی دنیا ارائه نمودند و این موضوع در اسناد بالادستی برنامه‌ریز...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 13  issue 2

pages  121- 137

publication date 2016-09

By following a journal you will be notified via email when a new issue of this journal is published.

Keywords

No Keywords

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023